Обоснование кодификаторов системы. обработки данных о неисправностях

Перед решением другой ключевой задачи формиро­вания информационного обеспечения — задачи опреде­ления объема кодификаторов рассмотрим области при­менения кодификаторов при сборе и анализе сведений о надежности. Действующие ГОСТы требуют, чтобы методы классификации и кодирования первичных дан­ных о надежности обеспечивали представление инфор­мации из карточек учета неисправностей в виде кодов для перевода ее на машинные носители. Кодификаторы должны быть установлены в отраслевых нормативно — технических документах. Кодификаторы нужны — прежде всего в головной организации по обработке данных а неисправностях для ввода информации в ЭВМ в виде цифровых символов, соответствующих текстам описания характера и внешнего проявления неисправности. Коди­фикаторы используют также на всех эксплуатационных предприятиях, на которых внедрена система автомати­зированной обработки информации.

Применение в карточке стандартных формулировок для внешнего проявления и характера неисправности (на рис. 4.3 в местах записи этих реквизитов преду­смотрены специальные окна для заполнения их четырех­значными кодами) дало бы весьма ощутимые преиму­щества при подготовке информации к вводу в ЭВМ. Прежде всего стандартная формулировка обеспечит однозначность в понимании существа происшедшего отказа при анализе карточки десятками специалистов как эксплуатирующих подразделений гражданской авиа­ция, так и заводов-поставщиков авиатехники. Такой эффект порождается отказом от слишком большого раз­нообразия словарных средств обычного языка, иногда являющихся причиной разночтений. Применение стан­дартных формулировок снизит трудозатраты на ввод данных в ЭВМ. Кодирование текстов описания неис­правностей на эксплуатационном предприятии делает реальной передачу сведений о надежности авиатехники по каналам связи непосредственно в память ЭВМ без пересылки первичных сообщений или магнитных лент по почте.

Для реализации перспективного метода кодирования сведений о неисправностях на месте их обнаружения 228

в эксплуатационные предприятия направляются исчер­пывающие, но не очень громоздкие кодификаторы сис­темы «Надежность авиатехники». Однако окончательно’ перейти к цифровому кодированию всех данных в кар­точках учета неисправностей пока не удалось: во-пер­вых, нежелательно возлагать дополнительную работу по кодированию на инженерно-технический состав, непо­средственно занятый на технике, во-вторых, из-за неог — работанности достаточно подробных и не очень громозд-‘ ких кодификаторов.

Кодификаторы системы «Надежность авиатехники» должны содержать коды большинства реквизитов кар­точки учета. Исключение составляют реквизиты, запол­няемые цифровой ‘информацией (например, наработка — или заводской номер). — Перечень реквизитов карточек и нормативно-технической документации, необходимой для кодирования, приведен в табл. 28. В настоящее время эксплуатационные предприятия гражданской авиации могут быть обеспечены несложными кодифика­торами только первых четырех из названных в таблице — типов. — Объем — код-ификатарон для адреса інеіистфавноети’ (она называется кодификатором ключевых слов) весьма велик. В табл. 25 приведены данные об объеме соответ­ствующих кодификаторов (в информационных си-стемнх на ЭВМ они называются словарями) по системам ЛА„

Табл и ц a 28 —

Организация-владелец

Кодификатор- предприятий и: о. рга — низ аций гр ажданокой авиации

Тип воздушного судна

Кодификатор типов воздушных су,-

(двигателя)

дой

Кодификатор типов двигателей

Завод-изготовитель

»- предприятий и орга.~ низаций гражданской авиации.

Адрес неисправности (система, подсистема, аг­регат, деталь)

Кодификатор ключевых слов

Внешние проявления

Перечень наиболее употребитель*

отказа

ных формулировок внешних, щюяш* лений

Характер, сущность от­каза

То же

Наименование признака и ісоотіветствуїшцет-о реквизита в Карточке

Нормативно-техническая документация, исшолвзуема-я. — при кодировании

12

22

23

24

чіодсистемаїм, агрегатам, узлам и деталям. Всего в ко­дификаторе адресов неисправностей будет 9620 позиций. Конечно,, маловероятно внедрение работы с таким коди­фикатором в практику оформления первичных сообще­ний о неисправностях, если для инженерно-технического ■состава авиапредприятий эта операция будет обуслов­лена только необходимостью оформить карточку. ,

Однако при анализе любой неисправности инженер­но-технический персонал гражданской авиации исполь — — зует технические описания. Если коды отказавших аг­регатов и деталей будут проставлены в техническом описании, то перенести их после анализа существа неис­правности в карточку учета не составляет большого ■труда. Поэтому цифровое кодирование адреса неисправ­ности нетрудно реализовать для тех типов ЛА, по кото­рым техническая документация имеет шифры разделов, .’подразделов и пунктов в соответствии с требованиями ■стандартов. Такая техническая документация уже поступает на авиапредприятия вместе с новой авиацион­ной техникой. Шифр раздела в ней соответствует коду ■системы ЛА, подраздела — коду подсистемы, а пунк­та — коду в системе.

Создание классификаторов для внешнего проявления и характера неисправности представляет гораздо более сложную проблему, чем классификация других призна­ков в карточке учета. Здесь необходимо закодировать произвольный текст с непростыми понятиями. Опыт использования карточек учета при анализе надежности — авиатехники позволяет охарактеризовать лингвистиче­ские особенности текстов описания неисправностей.

Как .показали лингвистические исследования языка текстов описания неисправностей в карточках учета [15], все многообразие неисправностей авиатехники можно выразить всего 1200—1600 словами. Из 1200 слов слова­ря языка текстов описания Неисправностей высшая час­тотность первых 100 слов составляет 67 %, 200 слов — ®0 % и 500 слов — 93,3 %, т. е. с помощью 500 слов можно охарактеризовать неисправность авиатехники ^более чем в 90 % случаев.

Текст описаний состоит обычно из нераспростріанен — :ных предложений (например, трещина длиной 20 мм). В текстах существительные составляют 36 %, прилага­тельные и причастия — 26 °/о, глаголы — 16 %. Широко используются понятия, выраженные отдельными слова — 1230.

ми и именными словосо­четаниями. Эти понятия означают различного рода объекты: гидравлический

Подпись: 90Подпись:Подпись: 70Подпись: ВОПодпись:Подпись: 200насос, гидроусилитель, ра­диостанция УКВ. В имен­ных ловосочетаниях глав­ным еловом (основным носителем смысла) явля­ются существительные, а остальные слова служат для уточнения главного слова. Например, разру­шение лобового стекла.

Число слов в понятиях ко­леблется от одного до де­сяти, и в среднем равно четырем, число букв в поняти­ях ~20.

Таким образом, грамматическая структура языка; текста описания неисправностей авиатехники доста­точно проста. Поэтому нет необходимости при созданиш специализированного информационно-поискового языкам описаний внешнего проявления и характера неисправ­ностей разрабатывать систему кодирования понятий,, отношений и синтаксических правил.

. Проведенное исследование частоты встречи устойчи­вых словосочетаний q в текстах описания неисправно­стей показало, что из 2000 устойчивых словосочетаний,, выявленных в текстах карточек учета, высшая частот­ность первых 100 словосочетаний составляет 80 %, а 500» словосочетаний — 96,4 % (рис. 6.2). На остальные 1500 остается ~3,6 %. Этот результат позволяет наде­яться, что информационно-поисковый язык будет несло­жен, так как частотные словари словосочетаний — осно­ва для составления кодификаторов внешних проявлений и характера неисправностей.

Методика составления кодификаторов существенно определяется сферой его применения. Рассмотрим мето­дику построения кодификатора описаний неисправно­стей для головной в отрасли организации по анализу надежности авиатехники. В дальнейшем охарактеризу— ем и методику построения кодификатора для использо-. вания в подразделениях гражданской авиации, непо-. средственно занятых эксплуатацией авиатехники.

Для оценки надежности авиатехники’ в головной ^организации отрасли выходные документы выдаются в виде, удобном любому пользователю. Никаких кодов в этих документах не используется, а все признаки неис­правностей описываются обычным языком, т. е. авто­матически декодируются. Операции автоматического де­кодирования зачастую (например, при получении свод­ных данных о неисправностях какого-то типа ЛА с ■сортировкой по техническому адресу и характеру. неис­правности) занимает много машинного времени. Причи­на в том, что машинные кодификаторы (словари) не ^помещаются сразу в оперативное запоминающее уст­ройство, а вызываются туда частями. Бели лее словарь полностью помещается в оперативной памяти, время. декодирования удается сократить на 20—30 %. Таким образом, при формировании кодификаторов, используе­мых в ЭВМ, необходимо максимизировать полноту ма­шинного словаря при ограничении располагаемой памя­ти для его записи.

.Обозначим:

]-= 1, 2,…,/ — номера возможных формулировок. описания неисправностей в карточках учета;

■Pj — вероятность того, что формулировка с номером j понадобится для декодирования при ответе на запрос. ■Считается, что если в запросе формулировка понадобит­ся несколько раз, то это приведет к нескольким обраще­ниям в словарь. По статистике выполненных ответов на запросы в головной организации нетрудно посчитать. все Ру,

Cj — объем памяти, необходимый для размещения 7-й формулировки. По существу, это просто число букв — в формулировке с учетом пробелов (пример дан в тгабл. 29);

Xj=l, если /-я формулировка включена в кодифика­тор, и 0 — в остальных случаях;

P(J) —вероятность того, что понадобившаяся в про­извольном запросе формулировка оказалась записанной ■в память ЭВМ.

Теперь задача назначения оптимального объема ко­дирования при записи на машинные носители описания неисправности формализуется как задача линейного щелочисленного программирования;

шайти такие х,, чтобы обеспечить максимум

j

Подпись: Р(І)=^РіХ І / = ! 2132

/

Ксщ

Формулировка

, s я е>

It*

!°” 81 !*§ к 3 Ёё

. «

81 га я М ё о о га ё л

<=> ч

ЇҐ

т

СІ(М

Не іработает (характер не установ­лен)

ні

14,410

■3

Щ|5

То же (изделие рекламировано или исследуется)

w

5,20

■I’ll

ЮЮ|2

Отсутствует в. перечне Нарушение формы или размеров

2(1

2,т

т

036

Износ, выработка (указать место)

1,5

2,62

зо

,3:82

Нагарообразование (указать мес­то)

27

0,96

40

606

Потертость, наклеп (указать место)

17

0,54

27і

81512

Усадка, усыхание, уплотнений. Нарушение свойств

2!7.

(1,20

20

1(6*8

Замыкание короткое (отличать 169)

46

1,42

10

Г69

Замыкание межвитковое

20

2,62

2

•2(70

Изменение параметров, (отличать 354, 4Ш)

2ft

9,ЗО-

9

4100

Контакт отсутствует, подгорание

30

2,83

ІЗ

473

» не размыкается, залипа-

ние

32

1Д1

24

1594

Контакт перемещающийся

22

1,01

18

■6313

Потеря упругости

■ Кб

• .1,62:’.

ІЗ.

‘6ЮЭ

» свойств электро-изоляцией

02

‘ 2,46

34

8155

Утечка (для. элементов РЭО)

■ 6

0,7(3′..

21

4115

Негерметичность (указать место, отличать 404, 4117.)

. (14

1,46. •

31

4104

Негерметичность уплотнения

• 26

1 0,96

36

4|16 я 1

» внутренняя (меж­ду полостями.)

25

ода

ЗЭ

1350

Недостаточная производительность, мощность

411

0,!777

2(5

354

Нестабильная работа схемы, эле­мента (отличать 2710)

Нарушение целости

34

1,27.’

32

292

‘ Коррозия, окисление (указать мес­то)

: 18-

0,89′,

35

(ISO

Надиры, забоины.( указать место и размер)-

•14

Д’66-

6

ШІ5

Обрыв, (указать чего, отличать 531)

5

4,00′

7

53(1

» провода.

‘ 1,3

■ 3,Ю-“

37

5631

Отставание, отклейкш (указать че­го)

‘ 19

{

058-

/

Код

Формулировка

1 Необходи­мый объем памяти, байт

. «

к к я рЗ д

О сг)

Ь Л

<=> ч

та С5 ~

£г е^з

ІІ7

бэа

Перегорание, сгорание

20

1,62

14.

5S4

» электроламп

212

2,08

.38

598

Повреждение, перетирание (ука­зать чего)

23

0,64

.26.

607

Порыв, порез, растрескивание (из­делий из неметаллов)

2,0

1,23 ,

19

690

Разрушение (указать место, отли­чать 69:7, 698)

40

1,58

38

697

Разрушение уплотнений

21

1,13

6

698

» крепежа

18

8,90

8

7810

Трещина (указать место и размер, отличать Sill)

7

3,00

І6

81,1

Трещина крепежа

Нарушение регулировки или взаим­ного положения

45

1,81

33

‘163

Заедание, защемление, тугое дви­жение

32

1,39

29

чет

Заклинивание, спекание

21

■1,08

39

099

Разбалансировка, неуравновешен­ность

за

0,64

4

4ЮіЗ

Разрегулировка (указать параметр)

14

4,00

аїри условии

j

2 Сл-sSCp, (6.46)

Ї=1

где Ср — располагаемый объем памяти для записи словаря.

Чтобы как-то компенсировать заложенное в эту эпостановку задачи предположение об одинаковой важ­ности всех J формулировок описаний неисправностей, наиболее важные (хотя и редко встречающиеся) форму­лировки типа «Пожар» или «Самовыключение двига­теля» априори включаются в кодификатор.

Целочисленная задача (6.15), (6.16) хорошо решает­ся с помощью стандартного пакета прикладных про­грамм линейного программирования. При большом чис­ле формулировок J ее точное решение мало отличается от приближенного (без ограничения на целочислен- ность). Приближенное решение задачи (6.15), (6.16)

очень легко получить. Для этого нужно расположить S34

Рис. 6.3. Вероятность описания характера неисправностей пер­выми формулировками в переч­не (/) и формулировками клас­сификатора (2) при распола­гаемом объеме памяти С. р

Обоснование кодификаторов системы. обработки данных о неисправностяхвсе формулировки в порядке убывания по критерию — «эффективность-стоимость», Т. е. ПО отношению Pj/Cj„. и включить в словарь первые М формулировок, суммар­ный объем памяти для которых не превышает Ср.

Оптимизация состава кодификатора путем формаль­ного решения задачи (6.15), (6.16) позволила сократить число формулировок описаний неисправностей в машин­ном словаре до 450—600 из первоначально применяемых 3000. При этом вероятность автоматического декодиро­вания уменьшилась всего на 0,3 %. На рис. 6.3 (кривая 2) показаны результаты решения задачи (6.1’5), (6.16) при Ср=(2000—10 000 байт. При сокращении Ср на 20—■ 25 % примерно на столько же сокращается и число фор­мулировок в машинном кодификаторе. Но при правиль­ном отборе сокращенных формулировок вероятность. описания произвольной неисправности оставшимися, кодами уменьшается всего на 2—3 %. При автоматиче­ском декодировании нельзя считать потерянными и эти. 2—3 % описаний, так как в случае, если соответствую­щей формулировки нет в словаре, ЭВМ выдает цифро­вой код, который можно исправить вручную.

Формальная постановка задачи обоснования содер­жания кодификаторов для эксплуатирующих подразде­лений несколько меняется. Ограничение типа (6.16) в ней есть, так как существует какой-то объем Ср перечня,- стандартных формулировок для описания неисправно­сти, за пределами которого человек теряет интерес к. поиску в справочнике и придумывает формулировку сам. Но в (6.16) все Сj следует полагать равными между собой. Справочник, содержащий стандартные формули­ровки, печатается обычно так, чтобы любая формули­ровка — занимала в — нем одну строку; Получается, что^

объем справочника зависит только от числа формулиро­вок М в нем, и именно это число выступает в качестве ограничения.

Решение задачи (6.15), (6.16) при таком ограниче­нии получается просто отбором первых М формулиро­вок в ранжированном ряду по убыванию Pj. В качестве. характеристики нужности /-й формулировки при обосно­вании классификатора для эксплуатирующих подразде­лений следует использовать Pj-вероятность применения J-й формулировки при описании неисправности, т. е. частоту использования соответствующих слов языка карточек учета. Пересмотрев все употребляемые фор­мулировки, можно рекомендовать более информативный их набор, т. е. усовершенствовать кодификатор.

Практическая проверка позволила исключить из пе­речня малоинфор’мативные формулировки. В оконча­тельной редакции осталось около 200 формулировок. Часть из них, описывающая характер неисправности, помещена в табл. 29. Последняя графа этой таблицы характеризует частотность применения формулировки, а первая — популярность ее в порядке убывания Pj. Первые 67 формулировок позволяют описать 97,3 % всех характеров неисправностей ‘(кривая 1). Сравнение кри­вых 1 и 2 соответственно на рис. 6.3 и 6.2 характеризует эффект работы по улучшению первоначальной редакции перечня. Сто формулировок в нем примерно эквивалент­но 300, наиболее часто встречающимся словссочетани — •-ям в текстах описания неисправностей. Сравнение кри­вых 1 и 2 на рис. 6.3 показывает разницу в кодификато­рах для обработки информации на ЭВМ и для описания. неисправностей в эксплуатирующих подразделениях. Кодификатор для работы в авиапредприятиях, конечно, гораздо проще. В нем формулировок столько, сколько можно разметить на двух страницах. Но около 3 % не­исправностей с помощью этого кодификатора не описы­вается. Они неизбежно будут даны произвольным тек­стом в реквизите «Краткое описание характера (сущно­сти) отказа» карточки учета, который необходимо до­полнительно кодировать для ЭВМ. Машинный кодифи­катор. (словарь) характеров неисправностей содержит •450 формулировок, с помощью которых описывается :более 99 % всех неисправностей. Формулировки машиш того словаря не всегда совпадают с формулировками перечня. Многие описания неисправностей кодируются перед вводом в ЭВМ более подробно.

“23ІІ

1.  

[1] (6′ — tj-)h,

6=1

где Ц — положителыные, убывающие по / коэффициенты, яв­ляющиеся обобщением сумм нормализованных интервалов, кото­рые использованы нами ранее.

Завершим рассмотрение методоїв оценки параметров функции надежности по цензурированным выборкам. 1-4Q

[2] В этом и двух последующих параграфах использованы мате­риалы — работ Е. П. Чувиляева, выполнявшихся — под руководством одного из авторов.

[3]